BSS Digital2Speech

Продукт

Название базовой системы (платформы):	Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики:	Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС)
Дата последнего релиза:	2024/02/29
Технологии:	Речевые технологии

Содержание

2024
- Повышение качества распознавания речи за счет улучшения диаризации
- В составе решения для управления контакт-центром
2022
2021: Модули Digital2Speech
2020
- Прохождение тестирования на совместимость со Скала-Р
- Описание возможностей Digital2Speech

Основные статьи:

Digital2Speech – платформа для автоматизации омниканального обслуживания клиентов, обратившихся в службу поддержки.

2024

Повышение качества распознавания речи за счет улучшения диаризации

BSS повысила качество распознавания речи за счет улучшения диаризации. Об этом разработчик сообщил 29 февраля 2024 года.

Улучшение технологии определения спикеров в монозаписях, позволяет получать более качественную транскрибацию разговоров для последующего анализа.

В ходе анализа аудиозаписей могут возникать проблемы с путаницей источника речи – кто и что говорит. Это влияет на результаты речевой аналитики, и в целом на эффективность работы виртуальных помощников. Как защищать «поумневшие» промышленные сети: «Синоникс» на страже безопасного объединения изолированных сетей 4.2 т

Диаризация позволяет разделить аудиопотоки при общении и определить, кто именно говорит в конкретный момент диалога. Применяется для анализа монозаписей и записей с аудиобеджей, а также для улучшения качества распознавания записи с направленных стереомикрофонов при проникновении посторонних звуков.

На февраль 2024 года разработчики BSS сконцентрировались на трех основных направлениях по улучшению диаризации, которые позволят устранить недочеты при распознавании речи и повысить эффективность речевой аналитики.

Во-первых, добавили классификатор каналов. Диалоги с клиентами обычно начинают операторы. Поэтому первый канал, как правило, присваивается оператору, что раньше приводило к путаницам, так как не всегда разговор начинал оператор. Теперь записи речи клиента и оператора определяются двумя моделями. Первая разделяет реплики говорящих по биометрическим признакам (голосу). Вторая – по характерной лексике понимает кто из говорящих оператор, а кто клиент. В результате принадлежность канала определяется корректно.

Во-вторых, аудиозаписи проходят через верификацию каналов. Например, курьер в течение дня развозит заказы, и все это время ведется аудиозапись. Для анализа важны только те фрагменты, где курьер разговаривает с клиентами. Именно эти части записи с помощью технологии верификации каналов вычленяются из всего аудиопотока для диаризации. Это позволяет существенно снизить нагрузку на ИТ-инфраструктуру и сократить время обработки и анализа аудио.

В-третьих, существенно улучшено качество работы технологии по исключению дублирования реплик. Обычно консультации в банках записываются с помощью двух направленных микрофонов: один записывает клиента, другой – консультанта. Но нередко речь клиента записывается микрофоном консультанта и наоборот. Это приводит к дублированию информации в текстовой расшифровке и усложняет анализ диалога с помощью речевой аналитики. Добиться исключения дублей реплик в аудиофайле удалось за счет соединения обеих звуковых дорожек в одну стереозапись. Только после этого проводится транскрибация аудиофайла. Этот инструмент уже показал свою эффективность в нескольких банках.

Диаризация повышает качество текстов при транскрибации и значительно улучшает качество речи при использовании с системой распознавания. Этой технологией пользуются многие разработчики, но мы смогли ее существенно улучшить и продолжаем постоянно развивать. Она востребована, так как делает речевые технологии более доступными. Многие компании записывают разговоры с клиентами на устаревшем оборудовании в формате моно. Диаризация позволяет таким заказчикам внедряет ту же речевую аналитику без необходимости замены дорогостоящего оборудования, – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.

В составе решения для управления контакт-центром

САТЕЛ и BSS создали программный продукт, позволяющий оптимизировать работу с обращениями клиентов во всех каналах цифровых коммуникаций. Данная система помогает ускорить обслуживание и работу операторов контакт-центра, сокращая и автоматизируя рутинные операции. Решение построено на базе ядра омниканального контакт-центра РТУ-Атмосфера и интеллектуальной диалоговой платформы Digital2Speech. Об этом САТЕЛ сообщил 17 января 2024 года. Подробнее здесь.

2022

Включение в «Каталог взаимозаменяемости ПО для финансового сектора»

Компания BSS 11 августа 2022 года сообщила о включении собственных решений по дистанционному банковскому обслуживанию, речевым технологиям и информационной безопасности в «Каталог взаимозаменяемости ПО для финансового сектора». В частности от BSS в Каталог включена омниканальная диалоговая платформа Digital2Speech. Подробнее здесь.

Функционал, позволяющий оптимизировать процесс первичной разметки

1 июня 2022 года компания BSS объявила о завершении первого этапа проекта разработки диалоговых технологий на базе искусственного интеллекта и машинного обучения при грантовой поддержке Российского фонда развития информационных технологий (РФРИТ).

BSS Digital2Speech

По информации компании, целью проекта является создание российского конкурентного вендорского решения на основе речевых технологий, которое станет основой импортонезависимости. Его задача — обеспечить бизнес и госструктуры России, СНГ и других стран комплексом речевых услуг с использованием искусственного интеллекта и машинного обучения.

Полный стек собственных технологий будет усилен использованием end-to-end (E2E) подхода в распознавании речи и few-shot обучением в понимании естественного языка. Это позволит сократить время и ресурсы на создание прикладных решений в области диалоговых технологий (текстовых и голосовых интеллектуальных помощников, текстовой и голосовой аналитики и т. д.).

На первом этапе проекта реализованы возможности в рамках омниканальной диалоговой платформы Digital2Speech, касающиеся распознавания речи, речевой аналитики и инструментов поддержания диалогов. В частности:

Модели распознавания голоса в текст, основанные на технологиях искусственного интеллекта, что позволяет оптимизировать качество распознавания речи с преобладанием лексики запросов к государственным учреждениям через использование адаптированной e2e ASR модели (дает более надлежащую точность распознавания речи и понимания естественного языка) в проектах по голосовым виртуальным ассистентам.
Функционал, позволяющий оптимизировать процесс первичной разметки и проверки существующей разметки реплик перед обучением моделей классификаторов, используя разбивку набора на семантические кластеры.
Возможности, позволяющие обеспечить пользователям речевой аналитики функции быстрой фильтрации и оценки анализируемых диалогов с настройкой значений фильтрации и оценки, с указанием условий по количественно-временным и лексико-семантическим параметрам, а также возможности по построению и выгрузке отчётов по результатам проведенного речевого анализа.
Механики свободного диалога, использование которых позволяет оптимизировать архитектуру разработки сценариев обслуживания, повысить гибкость приложений по обработке клиентского запроса виртуальными ассистентами: обработка на уровне функциональных элементов слотов, исключений, смены основного намерения без необходимости написания кода.

В ходе уже стартовавшего второго этапа продолжается реализация обновленного функционала речевых решений BSS: совершенствование распознавания речи, инструментов поддержки диалогов и речевой аналитики. Окончание второго этапа планируется в январе 2023 года.

Интеграция с L2U InKnowledge

16 мая 2022 года компания BSS сообщила, что База знаний InKnowledge от компании L2U, партнера BSS, встроена в технологический стек омниканальной диалоговой платформы Digital2Speech. Она расширяет возможности платформы, выступая единым источником информации, обеспечивающим синхронизацию и поддержание актуальности информации у интегрированных с ней «потребителей» данных (CRM, сайты, порталы, АРМ операторов контакт-центров и т. п.).

Это отечественное решение, по утверждению компании, по качеству, быстродействию и функциональным возможностям не уступает актуальным зарубежным системам хранения и управления знаниями, таким как Confluence, Notion, SharePoint, KMS Lighthouse и другим.

Основное отличие L2U InKnowledge состоит в том, что эта База знаний (БЗ) обеспечивает омниканальность знаний, поддерживающая работу с операторами, роботами, а также в формате самообслуживания. Она может служить платформой для организации единого справочного центра компании и информационной поддержки обслуживания клиентов во всех каналах коммуникации.

Особенности L2U InKnowledge:

Входит в реестр отечественного ПО (свидетельство № 2021617316).
Быстро устанавливается, в том числе в закрытом контуре заказчика.
Гибко интегрируется с инфраструктурой заказчика.
Легко масштабируется, повышая эффективность работы служб поддержки клиентов, service-desk, маркетинга, HR и других подразделений.
No-code. Позволяет самостоятельно без программирования настраивать интерфейсы из набора виджетов под разные задачи пользователей.
Позволяет осуществлять быструю миграцию контента из разных систем.

Возможности L2U InKnowledge:

Хранение структурированной и неструктурированной информации.
Удобный ввод информации в структуры данных.
Управление жизненным циклом статей в БЗ.
Поддержка нескольких информационных доменов в одной инсталляции.
Гибкий поиск по информации в БЗ с различными вариациями выдачи поисковых результатов.
Гибкий пользовательский интерфейс.

«Пользователи нашей омниканальной диалоговой платформы Digital2Speech высоко оценивают возможности базы знаний InKnowledge. Они отмечают, что в сложившейся геополитической ситуации эта российская разработка - оптимальная альтернатива иностранным аналогам. Возможности базы знаний позволяют быстро интегрировать продукт в инфраструктуру компании, добиться снижения операционных расходов, легко масштабировать решение, фокусируясь на развитии и росте бизнеса», -

отметил директор по продажам компании Виталий Патешман.

«Приобретая пакетное решение, включающее виртуального ассистента, который интегрирован с полноценной базой знаний, заказчик снижает затраты на внедрение и получает комплексное предложение с омниканальным источником знаний, которое закрывает как текстовый, так и голосовой канал взаимодействия с клиентами и предоставляет информацию из единого источника роботам, операторам и любым другим потребителям знаний», -

подчеркнул генеральный директор L2U Кирилл Кузнецов.

2021: Модули Digital2Speech

Омниканальная диалоговая платформа Digital2Speech основана на технологиях собственной разработки BSS.

На февраль 2021 года Digital2Speech состоит из ряда интегрированных между собой модулей, работающих на едином ядре:

Модуль выявления намерений клиента, в том числе извлечение ключевых атрибутов из речи, включая инструмент тренировки и настройки моделей.
Самообучающийся виртуальный помощник.
Распознавание речи, включая инструмент тренировки и настройки моделей.
Модуль голосовой биометрии, включающий идентификацию и верификацию говорящего в течение всего разговора.
Модуль речевой аналитики, включая распознавание настроений и степени удовлетворенности говорящего с инструментом по управлению и настройке продуктом.
Инструмент создания и управления сценариями диалогов и сервисов самообслуживания.
Предиктивный синтез текста в живую речь.

Платформа позволяет обслуживать клиентов по всем каналам, включая наиболее естественный для человека — речевой. При этом используются все возможности омниканальности — можно начать диалог в голосовом канале и продолжить в текстовом чате и наоборот. Простые в использовании инструменты позволяют оперативно менять и создавать новые сценарии диалогов без привлечения специалистов.

2020

Прохождение тестирования на совместимость со Скала-Р

13 августа 2020 года компания СКАЛА-Р сообщила о том, что сразу три системы, связанные с организацией работы контакт-центров, прошли успешное тестирование на совместимость с гиперконвергентной платформой СКАЛА-Р: контакт-центр производства ООО «НТЦ ПРОТЕЙ», диалоговая платформа Digital2Speech производства компании BSS, система управления рабочей нагрузкой на контакт-центр АРГУС WFM CC производства ООО «НТЦ АРГУС». Подробнее здесь.

Описание возможностей Digital2Speech

По информации на июнь 2020 года Digital2Speech – это единая омниканальная платформа на базе искусственного интеллекта, которая включает в себя сервисы распознавания речи, смысла и эмоций, а также речевую аналитику и голосовую биометрию. Голосовые помощники и чат-боты платформы отвечают на обращения клиентов, что снижает нагрузку на контакт-центр и обеспечивает поддержку обращений в круглосуточном режиме. Если роботы не могут ответить на вопрос, они переводят звонки на сотрудников компании.

Нейронные сети позволяют роботам постоянно совершенствоваться: берут на себя все больше задач, анализируют интонации, тембр и паузы, что повышает точность понимания запросов. В случае типовых обращений Digital2Speech способна обеспечить полную автоматизацию взаимодействия с клиентами. Это особенно актуально в пиковые периоды – обслуживание клиентов происходит без длительного ожидания на линии, и только часть звонков переводится на операторов.

Digital2Speech позволяет масштабировать клиентский сервис до организации полноценного омниканального обслуживания с возможностями голосового управления приложениями на мобильных устройствах и веб-сайтах. ИТ-решение помогает перевести коммуникации из голосового канала в текстовый и обратно и обладает функциями аутентификации и идентификации по голосу. Набор гибких инструментов позволяет компаниям самостоятельно обучать роботов и адаптировать к различным индустриям.

AI-роботы учитывают особенности, техническую терминологию, характерные вопросы и типичные диалоги конкретной организации. Платформа может быстро подстраиваться под узкие требования компании и ее клиентов, в том числе на основе предоставленной компанией базы диалогов, что делает ее применимой для любой индустрии коммерческих и государственных предприятий, В2В- и В2С-сегментов.

Digital2Speech от BSS безопасно: решение разработано в соответствии с принципами и правилами обработки персональных данных, предусмотренных федеральным законом (152-ФЗ).

Источник — «https://fin.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:BSS_Digital2Speech»